首页> 外文OA文献 >Putting Self-Supervised Token Embedding on the Tables
【2h】

Putting Self-Supervised Token Embedding on the Tables

机译:将自我监督的令牌嵌入表中

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Information distribution by electronic messages is a privileged means oftransmission for many businesses and individuals, often under the form ofplain-text tables. As their number grows, it becomes necessary to use analgorithm to extract text and numbers instead of a human. Usual methods arefocused on regular expressions or on a strict structure in the data, but arenot efficient when we have many variations, fuzzy structure or implicit labels.In this paper we introduce SC2T, a totally self-supervised model forconstructing vector representations of tokens in semi-structured messages byusing characters and context levels that address these issues. It can then beused for an unsupervised labeling of tokens, or be the basis for asemi-supervised information extraction system.
机译:通过电子消息进行信息分发是许多企业和个人的一种特权传输方式,通常采用纯文本表格的形式。随着数字的增长,有必要使用算法来提取文本和数字而不是人类。常用的方法侧重于正则表达式或数据中的严格结构,但是当我们具有多种变体,模糊结构或隐式标签时效率不高。本文介绍了SC2T,这是一种完全自我监督的模型,用于构造令牌中的向量表示通过使用解决这些问题的字符和上下文级别构建结构化消息。然后可以将其用于令牌的无监督标记,或者作为半监督信息提取系统的基础。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号